python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolCustom --subtask AtomNum
python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolCustom --subtask BondNum
python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolCustom --subtask FunctionalGroup

python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolEdit --subtask AddComponent
python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolEdit --subtask DelComponent
python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolEdit --subtask SubComponent

python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolOpt --subtask LogP
python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolOpt --subtask MR
python evaluate.py --name S1-MixReason-8B --output_dir xxx/evaluation/eval_result_qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105/ --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log --task MolOpt --subtask QED


python eval_csv.py --log_file qwen3-32b-tools-sft-0715-answer-temp08_tp09_rp105.log